Mạng nơron nhân tạo là gì? Các công bố khoa học về Mạng nơron nhân tạo
Mạng nơron nhân tạo là một hệ thống tính toán được lấy cảm hứng từ cách hoạt động của hệ thống nơron trong não người. Nó bao gồm một số lượng lớn các nơron nhân...
Mạng nơron nhân tạo là một hệ thống tính toán được lấy cảm hứng từ cách hoạt động của hệ thống nơron trong não người. Nó bao gồm một số lượng lớn các nơron nhân tạo được kết nối với nhau theo một cấu trúc thông qua các liên kết trọng số. Mạng nơron nhân tạo có khả năng tự học và tự điều chỉnh thông qua việc xử lý dữ liệu đầu vào và sản xuất dữ liệu đầu ra dựa trên thông tin đã học từ huấn luyện trước. Mạng nơron nhân tạo có thể được áp dụng trong nhiều lĩnh vực như nhận dạng hình ảnh, xử lý ngôn ngữ tự nhiên, dự đoán và điều khiển.
Mạng nơron nhân tạo được xây dựng dựa trên các nguyên tắc hoạt động của hệ thống nơron thần kinh trong não người. Nó gồm nhiều lớp nơron được kết nối với nhau thông qua các liên kết trọng số. Các liên kết trọng số này cho phép mạng nơron nhân tạo truyền tải và tích lũy thông tin qua các lớp nơron để tạo nên một quyết định hoặc đầu ra cuối cùng.
Một mạng nơron nhân tạo thường gồm ba phần chính: lớp đầu vào, lớp ẩn (hoặc nhiều lớp ẩn), và lớp đầu ra. Các lớp nơron trong mạng được tổ chức theo cấu trúc lưới, với mỗi nút trong lớp trước kết nối với tất cả các nút trong lớp tiếp theo. Đầu vào của mạng thường là các biến số, dữ liệu hoặc hình ảnh đầu vào và đầu ra của mạng là kết quả dự đoán, phân loại hoặc hành động.
Quá trình huấn luyện mạng nơron nhân tạo gồm hai giai đoạn chính: lan truyền tiến và lan truyền ngược. Trong giai đoạn lan truyền tiến, thông tin được truyền từ lớp đầu vào qua các lớp ẩn cho đến lớp đầu ra. Quá trình này dựa trên các liên kết trọng số và hàm kích hoạt để xử lý và tích lũy thông tin.
Trong giai đoạn lan truyền ngược, đánh giá sai sót giữa đầu ra thực tế và đầu ra dự đoán, sau đó điều chỉnh các liên kết trọng số để giảm sai số. Quá trình này được thực hiện thông qua thuật toán gradient descent và backpropagation. Backpropagation tính toán đạo hàm của hàm mất mát (loss function) theo các trọng số của mạng và cập nhật trọng số trong hướng giảm gradient để tối thiểu hóa sai số.
Mạng nơron nhân tạo có khả năng học từ dữ liệu và điều chỉnh các liên kết trọng số để đưa ra dự đoán chính xác hơn theo thời gian. Điều này cho phép nó được sử dụng trong rất nhiều ứng dụng như nhận dạng khuôn mặt, dịch máy, tự động lái xe, và nhiều lĩnh vực khác.
Danh sách công bố khoa học về chủ đề "mạng nơron nhân tạo":
Mục tiêu chính của nghiên cứu này là đánh giá và so sánh hiệu suất của các thuật toán học máy (ML) khác nhau, cụ thể là Mạng Nơron Nhân Tạo (ANN), Máy Học Tăng Cường (ELM) và thuật toán Cây Tăng Cường (Boosted), khi xem xét ảnh hưởng của các tỷ lệ đào tạo đối với kiểm tra trong việc dự đoán độ bền cắt của đất, một trong những tính chất kỹ thuật địa chất quan trọng nhất trong thiết kế và xây dựng công trình. Để thực hiện điều này, một cơ sở dữ liệu gồm 538 mẫu đất thu thập từ dự án nhà máy điện Long Phú 1, Việt Nam, đã được sử dụng để tạo ra các bộ dữ liệu cho quá trình mô hình hóa. Các tỷ lệ khác nhau (tức là 10/90, 20/80, 30/70, 40/60, 50/50, 60/40, 70/30, 80/20, và 90/10) đã được sử dụng để chia bộ dữ liệu thành bộ dữ liệu đào tạo và kiểm tra nhằm đánh giá hiệu suất của các mô hình. Các chỉ số thống kê phổ biến, chẳng hạn như Lỗi Bình Phương Trung Bình (RMSE), Lỗi Tuyệt Đối Trung Bình (MAE) và Hệ Số Tương Quan (R), đã được sử dụng để đánh giá khả năng dự báo của các mô hình dưới các tỷ lệ đào tạo và kiểm tra khác nhau. Ngoài ra, mô phỏng Monte Carlo đã được thực hiện đồng thời để đánh giá hiệu suất của các mô hình đề xuất, có tính đến ảnh hưởng của lấy mẫu ngẫu nhiên. Kết quả cho thấy mặc dù cả ba mô hình ML đều hoạt động tốt, nhưng ANN là mô hình chính xác nhất và ổn định nhất về mặt thống kê sau 1000 lần mô phỏng Monte Carlo (R Trung Bình = 0.9348) so với các mô hình khác như Boosted (R Trung Bình = 0.9192) và ELM (R Trung Bình = 0.8703). Điều tra về hiệu suất của các mô hình cho thấy khả năng dự báo của các mô hình ML bị ảnh hưởng lớn bởi các tỷ lệ đào tạo/kiểm tra, trong đó tỷ lệ 70/30 thể hiện hiệu suất tốt nhất của các mô hình. Một cách ngắn gọn, kết quả được trình bày ở đây thể hiện một cách thức hiệu quả trong việc lựa chọn các tỷ lệ dữ liệu phù hợp và mô hình ML tốt nhất để dự đoán chính xác độ bền cắt của đất, điều này sẽ hữu ích trong các giai đoạn thiết kế và kỹ thuật của các dự án xây dựng.
Bài viết này trình bày hai phương pháp tối ưu hóa quy trình hỗn hợp mạnh mẽ tích hợp mạng nơron nhân tạo (ANN) và hình thức tối ưu hóa ngẫu nhiên—các thuật toán di truyền (GA) và phương pháp xấp xỉ ngẫu nhiên đồng thời (SPSA). Một mô hình quy trình dựa trên ANN đã được phát triển hoàn toàn từ dữ liệu đầu vào–đầu ra của quy trình và sau đó không gian đầu vào của nó, bao gồm các biến thiết kế và biến vận hành, đã được tối ưu hóa bằng cách sử dụng hoặc phương pháp GA hoặc SPSA. Các phương pháp này sở hữu một số ưu điểm so với các kỹ thuật dự đoán xác định dựa trên gradient rất được sử dụng. Hiệu quả của các hình thức ANN-GA và ANN-SPSA trong sự hiện diện của dữ liệu quy trình không có tiếng ồn cũng như dữ liệu quy trình có tiếng ồn đã được chứng minh cho một hệ thống đại diện liên quan đến CSTR không đồng nhất. Nghiên cứu trường hợp xem xét một mục tiêu tối ưu hóa không đơn giản, mà ngoài việc thiết kế tham số truyền thống, còn giải quyết vấn đề thiết kế dung sai tối ưu. So sánh các kết quả với các kết quả từ một chiến lược mô hình hóa/tối ưu hóa xác định mạnh mẽ cho thấy rằng các phương pháp hỗn hợp có thể được áp dụng có hiệu quả cho tối ưu hóa quy trình.
- 1
- 2
- 3